随机分配是什么, 为什么重要, 对因果关系影响几何?
凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
正文
如何用统计方法建立因果关系?这是个很难回答的问题。统计检验可以确定一种效应是否具有统计学上的显著性,但不能确定实验是否导致这种效果。
嗯?那可能是个大惊喜! 在这一点上,你可能想知道所有那些使用统计数据来评估不同处理效果的研究。在显著性和因果关系之间有一个关键的区别:
• 统计程序确定效应是否显著。
• 实验设计决定了你可以多么自信地假设实验会导致这种效果。
在这篇文章中,学习如何在实验中使用随机分配来帮助你识别因果关系。
相关性、因果关系和混杂关系
作为科学方法的一个关键组成部分,实验通常在对照组和一个或多个实验组之间建立对比。其目的是确定实验组和对照组之间的差异是否具有统计学上的显著性。如果效应显著,则组别分配与不同的结果相关。
然而,正如你肯定听说过的那样,相关性并不一定意味着因果关系。换句话说,实验组可能有不同的平均结果,但干预可能不会导致这些差异,即使这些差异在统计学上是显著的。
很难明确说明实验引起的差异是由于潜在的混杂变量或混杂因素。混杂因素是实验组之间差异的替代解释。混杂变量与实验组和结果变量相关。在这种情况下,混杂变量可能是导致结果差异的实际原因,而不是实验本身。正如你所看到的,如果一个实验没有考虑到混杂变量,他们就会对结果产生偏差,使结果变得不可信。
实验中混杂因素的例子
一个例子将有助于阐明混杂因素如何使你的结果模糊不清。想象一下,我们正在进行一项实验,以确定定期摄入维生素是否能改善健康状况。为了简单起见,我们有以下两个实验组:
• 控制组: 不服用维生素补充剂
• 实验组:定期服用维生素补充剂
想象我们测量一个特定的健康结果。实验完成后,我们进行2个样本t检验,以确定这两组的平均结果是否不同。假设测试结果表明,实验组的平均健康结果明显优于对照组。
为什么我们不能假设维生素能改善健康状况呢? 毕竟,只有实验组服用了维生素。
结果差异的替代解释
这个问题的答案取决于我们如何分配实验对象。如果我们让受试者根据他们现有的维生素习惯来决定加入哪一组,就会为混杂变量打开大门。我们有理由认为,经常服用维生素的人往往也有其他健康的习惯。这些习惯是混杂因素,因为它们与维生素摄入(实验组)和健康结果测量相关。
事实上,研究发现,与不服用补充剂的人相比,服用补充剂的人更活跃,饮食更健康,血压更低,等等。如果已经定期服用维生素的受试者自愿加入实验组,他们就会把这些健康习惯不成比例地带到实验组。因此,这些习惯在实验组比对照组更普遍。
健康的习惯是混杂变量,是我们研究健康结果差异的潜在替代解释。研究开始时各组之间的这些系统性差异很可能会导致研究结束时健康结果的差异,而不是维生素摄入量本身!
如果我们的实验没有考虑这些混杂变量,我们就不能相信该结果。虽然我们对健康结果进行了2个样本的t检验,得出了具有统计学上显著的结果,但我们并不确定是维生素、生活习惯的系统性差异,还是这两者的某种组合导致了改善。
实验必须考虑混杂变量
你的实验设计必须考虑混杂变量来避免它们的问题。科学研究通常使用以下两种方法来处理混杂因素:
• 在观察研究中对其进行统计控制。
• 使用随机分配减少研究开始时实验组之间存在系统性差异的可能。
我将在以后的文章中讨论观察性研究。现在,让我们看看随机分配在实验设计中是如何工作的。
随机分配可以减少混杂变量的影响
注意,随机分配不同于随机抽样。随机抽样是获得能准确代表总体的样本的过程。
随机分配使用一个随机过程来分配实验对象到实验组。随机分配要求实验者能够控制所有研究对象的组别分配。对于我们的研究,我们必须能够分配参与者到对照组或补充组。显然,如果没有能力将受试者分配到那些组中,就不能使用随机分配!
此外,该过程必须具有将成员分配给任何组的均等概率。例如,在我们的维生素补充剂研究中,我们可以使用抛硬币将每个受试者分配到控制组或补充剂组中。对于更复杂的实验设计,可以使用随机数生成器,甚至可以从魔术帽中取名字。
随机分配过程在你的实验组中平均分配混杂属性。换句话说,随机性有助于消除组间的系统性差异。在我们的研究中,在对照组和实验组之间,抛硬币可以使有健康习惯的受试者的分布趋于平衡。因此,对于所有混杂变量,包括健康习惯,这两组人群开始时应该大致相同!
随机分配是对复杂问题的简单、优雅的解决方案。对于任何给定的研究领域,您可能都会担心一长串混杂变量。但是,使用随机分配,您无需知道它们是什么,如何检测它们甚至测量它们。而是使用随机分配在实验组中平均分配它们,这样就不会有问题。
由于随机分配有助于确保在实验开始时各组是均衡的,因此您可以更加确信是实验造成了研究后的差异
比较有和没有随机分配的维生素研究
来比较一下涉及到我们假设的维生素研究的两种场景。假设这项研究在两种场景下都获得了统计上显著的结果。
场景1: 我们不使用随机分配,而且不知道有更健康习惯的受试者最终会不成比例地进入补充剂处理组。实验组在健康习惯和维生素摄入方面有所不同。因此,我们不能确定是习惯还是维生素改善了结果。
场景2: 我们使用随机分配,因此,实验组和对照组的健康习惯水平大致相同。在实验组中有意引入维生素补充剂是两组之间的主要区别。因此,我们可以更有信心地断言,补充剂改善了健康结果。
对于这两种情况,统计结果可能是相同的。然而,第二种情况背后的方法更有力地证明了维生素补充剂摄入与健康结果之间的因果关系。
使用正确的方法有多重要?嗯,如果维生素和健康结果之间的关系不是因果关系,那么不管研究表明什么,摄入维生素都不会导致你的健康结果改善。相反,它可能是所有其他的健康习惯!
随机分配的缺点
随机分配有助于在实验开始时减少组间系统性差异的机会,从而减少混杂变量和替代解释的威胁。然而,这一过程并不总能平衡所有的混杂变量。它的随机性倾向于消除系统差异,但它并不总是成功。
有时随机分配是不可能的,因为实验者不能控制处理或自变量。例如,如果你想要确定一个人在测试中是否患有抑郁症,你不能随机地将受试者分配到这些组中。当你研究性别差异时也会遇到同样的困难。
在其他情况下,可能会有道德问题。例如,在一个随机实验中,研究人员想要停止对对照组的处理。然而,如果这种处理是接种疫苗,那么不接种疫苗可能是不道德的。
其他时候,随机分配是可能的,但是非常具有挑战性。例如,对于维生素的摄入,人们普遍认为,如果维生素补充剂能改善健康,那么只有在长期服用后才有效果。从长期来看,很难对一组的使用和另一组的不使用强制执行严格的随机分配。或者想象一个关于吸烟的研究。研究人员会发现很难将受试者随机分配到吸烟组和非吸烟组!
幸运的是,如果你不能使用随机分配来帮助减少混杂变量的问题,也有不同的方法。另一种主要方法是进行观察性研究,并将混杂因素纳入统计模型本身。
拓展性阅读:
2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。